AI资讯新闻榜单内容搜索- DeepSeek

GLM-4.5 验证：智谱已完成一轮“洗牌”

2025 年已过半，今年的大模型热度明显下降，关于基础模型的关注大多收敛到了 DeepSeek 与阿里通义上。相比之下，曾一度被标榜为大模型“国产替代”、信创之光的智谱 AI 所受到的关注度明显下降，过往高调的战略打法也渐显低迷。

来自主题: AI资讯

8509 点击 2025-08-04 20:18

当提示词优化器学会进化，竟能胜过强化学习

仅靠提示词优化就能超越 DeepSeek 开发的 GRPO 强化学习算法？是的，你没有看错。近日上线 arXiv 的一篇论文正是凭此吸引了无数眼球。

来自主题: AI技术研报

8172 点击 2025-08-01 11:42

SPIRAL：零和游戏自对弈成为语言模型推理训练的「免费午餐」

近年来，OpenAI o1 和 DeepSeek-R1 等模型的成功证明了强化学习能够显著提升语言模型的推理能力。通过基于结果的奖励机制，强化学习使模型能够发展出可泛化的推理策略，在复杂问题上取得了监督微调难以企及的进展。

来自主题: AI技术研报

6990 点击 2025-07-31 10:10

Kimi又火了，深度体验它的第一个Agent 后，我发现99%的AI产品忽略了这件「小事」

Kimi 又火了，在 DeepSeek 的热闹中沉寂大半年后，Kimi K2 悄悄在 LMArena 竞技场中从 DeepSeek 手中，夺过了全球开源第一的宝座。

来自主题: AI资讯

9798 点击 2025-07-21 12:05

全球最强开源「定理证明器」出世！十位华人核心，8B暴击671B DeepSeek

迄今为止最强大的开源定理证明器登场！Goedel-Prover-V2仅用8B参数击败671B的DeepSeek-Prover，并再次夺下数学PutnamBench冠军。十位核心贡献者，八大顶尖机构，让AI形式化证明再破纪录。

来自主题: AI资讯

7676 点击 2025-07-18 13:24

普林斯顿团队领衔发布最强开源数学定理证明模型：32B性能大幅超越前代SOTA DeepSeek 671B

近日，由普林斯顿大学牵头，联合清华大学、北京大学、上海交通大学、斯坦福大学，以及英伟达、亚马逊、Meta FAIR 等多家顶尖机构的研究者共同推出了新一代开源数学定理证明模型——Goedel-Prover-V2。

来自主题: AI资讯

9275 点击 2025-07-18 11:17

面对无解问题大模型竟会崩溃？港中文&华为联合提出首个大模型推理可靠性评估基准

今年初以 DeepSeek-r1 为代表的大模型在推理任务上展现强大的性能，引起广泛的热度。然而在面对一些无法回答或本身无解的问题时，这些模型竟试图去虚构不存在的信息去推理解答，生成了大量的事实错误、无意义思考过程和虚构答案，也被称为模型「幻觉」问题，如下图（a）所示，造成严重资源浪费且会误导用户，严重损害了模型的可靠性（Reliability）。

来自主题: AI技术研报

9311 点击 2025-07-17 11:24

你的 AI 回答，可能早被人夹了私货

最近大家有没有发现，好多店家开始用 DeepSeek 来营销了？

来自主题: AI资讯

9117 点击 2025-07-15 15:36

为什么 DeepSeek 大规模部署很便宜，本地很贵

为什么 DeepSeek-V3 据说在大规模服务时快速且便宜，但本地运行时却太慢且昂贵？为什么有些 AI 模型响应很慢，但一旦开始运行就变得很快？

来自主题: AI技术研报

9985 点击 2025-07-08 11:14

野生DeepSeek火了，速度碾压官方版，权重开源

没等来 DeepSeek 官方的 R2，却迎来了一个速度更快、性能不弱于 R1 的「野生」变体！这两天，一个名为「DeepSeek R1T2」的模型火了！这个模型的速度比 R1-0528 快 200%，比 R1 快 20%。除了速度上的显著优势，它在 GPQA Diamond（专家级推理能力问答基准）和 AIME 24（数学推理基准）上的表现均优于 R1，但未达到 R1-0528 的水平。

来自主题: AI资讯

9835 点击 2025-07-04 22:18